2 Analyse van kansengelijkheid
ITD | B Communication and Multimedia Design (CMD) - voltijd - versie 1.0
2.1 Inleiding
In dit hoofdstuk gaan we in op de onderwerpen bias, fairness en kansengelijkheid. Het doel is beter te begrijpen of er studenten zijn met minder kans op succes en of dit disproportioneel is. Dit kan duiden op kansenongelijkheid.
2.2 Analyse van kansengelijkheid
We onderzoeken kansengelijkheid door bias in de data te onderzoeken. Dit wordt ook wel een fairness analyse genoemd. Bias voor verschillende groepen studenten kan een teken zijn van kansenongelijkheid.
De volgende definities zijn van belang:
- Bevoorrechte groep: Een groep die als referentiegroep wordt beschouwd en mogelijk bevoordeeld wordt. Dit is in deze analyse altijd de meerderheidsgroep (bijv. vrouwen). Welke dit is per opleiding kan verschillen.
- Beschermde groep: Een groep waarvan wordt verwacht dat deze mogelijk benadeeld wordt (bijv. mannen). Dit zijn in deze analyse, afhankelijke van de variabele, altijd een of meer minderheidsgroepen.
2.2.1 Aantallen en percentages per groep
Voor de variabelen Geslacht, Aansluiting en Vooropleiding is de verdeling binnen deze opleiding als volgt:
| Retentie na 1 jaar |
| |||
|---|---|---|---|---|---|
Variabele | N | Totaal | Ja | Nee | p-value2 |
Geslacht | 1.613 | <0,001*** | |||
M | 915 (57%) | 521 (52%) | 394 (64%) | ||
V | 698 (43%) | 481 (48%) | 217 (36%) | ||
Aansluiting | 1.613 | <0,001*** | |||
Direct | 756 (47%) | 455 (45%) | 301 (49%) | ||
Tussenjaar | 176 (11%) | 125 (12%) | 51 (8,3%) | ||
Switch intern | 202 (13%) | 148 (15%) | 54 (8,8%) | ||
Switch extern | 445 (28%) | 254 (25%) | 191 (31%) | ||
2e Studie | 15 (0,9%) | 6 (0,6%) | 9 (1,5%) | ||
Na CD | 19 (1,2%) | 14 (1,4%) | 5 (0,8%) | ||
Overig | 0 (0%) | 0 (0%) | 0 (0%) | ||
Onbekend | 0 (0%) | 0 (0%) | 0 (0%) | ||
Vooropleiding | 1.613 | 0,018* | |||
MBO | 522 (32%) | 330 (33%) | 192 (31%) | ||
HAVO | 860 (53%) | 548 (55%) | 312 (51%) | ||
VWO | 58 (3,6%) | 34 (3,4%) | 24 (3,9%) | ||
BD | 92 (5,7%) | 42 (4,2%) | 50 (8,2%) | ||
CD | 30 (1,9%) | 21 (2,1%) | 9 (1,5%) | ||
HO | 51 (3,2%) | 27 (2,7%) | 24 (3,9%) | ||
Overig | 0 (0%) | 0 (0%) | 0 (0%) | ||
Onbekend | 0 (0%) | 0 (0%) | 0 (0%) | ||
1n (%) | |||||
2*p<0.05; **p<0.01; ***p<0.001 | |||||
2.2.2 Verdeling van kansen
Voordat we in meer detail kansengelijkheid gaan analyseren, onderzoeken we de verdeling van de kansen op retentie voor verschillende groepen studenten voor Geslacht, Aansluiting en Vooropleiding. De verdeling van deze kansen is uniek per opleiding.
Toelichting
- De verdeling van de kansen is te zien door de boxplot en de violin plot.
- De boxplot geeft de vier quartielen aan van de data: de box staat voor de middelste 50% van de data, met een streep die de mediaan aangeeft (de middelste waarde van de data). De lijnen (whiskers) geven de 1e 25% en laatste 25% van de data.
- De boxplot wordt gecombineerd met de violin plot, waarbij de breedte van de violin de dichtheid van de data aangeeft. Het kan zijn dat het lijkt alsof er geen violin is; in dat geval is de verdeling van het aantal studenten zeer breed en de violin vorm daardoor heel smal.
- Samen geven deze twee visualisaties een goed beeld van de verdeling van de voorspelde kansen van het model.
- De blauwe gestippelde lijn geeft de 50% kans aan; alle waarden die boven deze lijn vallen hebben een kans van 50% of meer op retentie. Hiervan voorspelt het model dat zij zeker doorstuderen. Deze grenslijn kan door de verdeling van groepen heen lopen. Bedenk in zo’n situatie dat voor een deel van de studenten het model voorspelt dat zij juist wel doorstromen (50% of meer) of juist niet (minder dan 50%).
2.2.2.1 Geslacht
2.2.2.2 Aansluiting
2.2.2.3 Vooropleiding
2.3 Conclusies
De uitkomsten van de fairness analyses zijn:
Variabele | Groep | N | % | Bias | Geen Bias | Negatieve Bias | Positieve Bias |
|---|---|---|---|---|---|---|---|
Geslacht | M | 915 | 56,7 | NTB | 0 | 0 | 0 |
V | 698 | 43,3 | Ja | 3 | 0 | 2 | |
Aansluiting | Direct | 756 | 46,9 | NTB | 0 | 0 | 0 |
Tussenjaar | 176 | 10,9 | Nee | 5 | 0 | 0 | |
Switch intern | 202 | 12,5 | Nee | 5 | 0 | 0 | |
Switch extern | 445 | 27,6 | Nee | 5 | 0 | 0 | |
2e Studie | 15 | 0,9 | Ja | 3 | 2 | 0 | |
Na CD | 19 | 1,2 | Nee | 4 | 1 | 0 | |
Vooropleiding | MBO | 522 | 32,4 | Nee | 5 | 0 | 0 |
HAVO | 860 | 53,3 | NTB | 0 | 0 | 0 | |
VWO | 58 | 3,6 | Nee | 5 | 0 | 0 | |
BD | 92 | 5,7 | Ja | 3 | 2 | 0 | |
CD | 30 | 1,9 | Nee | 4 | 1 | 0 | |
HO | 51 | 3,2 | Nee | 5 | 0 | 0 |
Toelichting:
- Bij rood is er sprake van een negatieve bias.
- Bij groen is er sprake van een positieve bias.
- Bij oranje is er sprake van een bias, maar zijn de aantallen studenten te laag om conclusies over een negatieve of positieve bias aan te verbinden.
- Er zijn vijf aspecten op basis waarvan de mate van bias gescoord wordt; het aantal in de kolommen geeft aan op hoeveel aspecten het oordeel over bias is gebaseerd. Voor een oordeel moet er minimaal op twee aspecten sprake zijn van bias.
- We hanteren een minimum van 15 studenten per categorie binnen een variabele.
- De bevoorrechte groep is grijs. Hiervan dient een eventuele bias nader bepaald te worden (NTB = Nader te bepalen). Dit is het geval als alle overige groepen binnen een variabelen een bias hebben.
Tekstuele samenvatting:
- Geslacht: Er is sprake van bias in Retentie na 1 jaar op basis van geslacht. Er is een positieve bias voor: V.
- Aansluiting: Er is sprake van bias in Retentie na 1 jaar op basis van aansluiting. Er is een negatieve bias voor: 2e Studie.
- Vooropleiding: Er is sprake van bias in Retentie na 1 jaar op basis van vooropleiding. Er is een negatieve bias voor: BD.
Verantwoording
Deze analyse maakt deel uit van het onderzoek naar kansengelijkheid van het lectoraat Learning Technology & Analytics van De Haagse Hogeschool: No Fairness without Awareness | Het rapport is door het lectoraat ontwikkeld in Quarto 1.6.39. | Template versie:
Copyright
Dr. Theo Bakker, Lectoraat Learning Technology & Analytics, De Haagse Hogeschool © 2023-2025. Alle rechten voorbehouden.